楽天は12月18日、経産省とNEDOが推進する生成AI開発支援「GENIAC」の枠組みで、日本語に特化した大規模言語モデル(LLM)「Rakuten AI 3.0」を開発した。約7000億個のパラメータを持つ国内最大規模級のモデルで、日本語ベンチマーク「MT-Bench(日本語版)」でトップスコアを記録し、楽天のサービス活用を想定した試験では同規模モデル比で最大90%のコスト削減(トークン当たり)を確認したという。
同モデルはMoE(Mixture of Experts、複数の専門サブモデルを必要時だけ動かす手法)を採用し、7000億のうち1トークン当たり約400億パラメータのみをアクティブ化する設計で計算効率を高めた。学習は社内マルチノードGPUクラスタで実行し、隔離されたクラウド環境で外部送信を避けたとしている。生成AI API統合基盤「Rakuten AIゲートウェイ」に追加し、「Rakuten AI」エージェント基盤を通じて楽天サービスへ順次導入予定。来春を目途にオープンウェイトとしての公開も計画する。
今後は日本市場向けの独自データでの最適化を進めつつ、サービス横断のAI活用拡大と運用コスト低減の両立が焦点となる。
source: PR TIMES
